Overview

Dataset statistics

Number of variables40
Number of observations21202
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory6.5 MiB
Average record size in memory320.0 B

Variable types

CAT28
NUM12

Reproduction

Analysis started2020-11-19 20:38:29.175040
Analysis finished2020-11-19 20:39:07.806052
Duration38.63 seconds
Versionpandas-profiling v2.8.0
Command linepandas_profiling --config_file config.yaml [YOUR_FILE.csv]
Download configurationconfig.yaml

Warnings

IN_SURDO_CEGUEIRA has constant value "Não" Constant
NU_NOTA_REDACAO is highly correlated with NU_NOTA_COMP3High correlation
NU_NOTA_COMP3 is highly correlated with NU_NOTA_REDACAOHigh correlation
IN_TREINEIRO is highly correlated with TP_ST_CONCLUSAOHigh correlation
TP_ST_CONCLUSAO is highly correlated with IN_TREINEIROHigh correlation
NU_INSCRICAO has unique values Unique
NU_NOTA_COMP1 has 400 (1.9%) zeros Zeros
NU_NOTA_COMP2 has 400 (1.9%) zeros Zeros
NU_NOTA_COMP3 has 402 (1.9%) zeros Zeros
NU_NOTA_COMP4 has 400 (1.9%) zeros Zeros
NU_NOTA_COMP5 has 2558 (12.1%) zeros Zeros
NU_NOTA_REDACAO has 400 (1.9%) zeros Zeros

Variables

NU_INSCRICAO
Real number (ℝ≥0)

UNIQUE

Distinct count21202
Unique (%)100.0%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean190003732873.80817
Minimum190001043648
Maximum190006119150
Zeros0
Zeros (%)0.0%
Memory size165.6 KiB

Quantile statistics

Minimum1.900010436e+11
5-th percentile1.900017004e+11
Q11.900026492e+11
median1.900038727e+11
Q31.900048775e+11
95-th percentile1.900059567e+11
Maximum1.900061192e+11
Range5075502
Interquartile range (IQR)2228387.25

Descriptive statistics

Standard deviation1477041.164
Coefficient of variation (CV)7.773748133e-06
Kurtosis-1.356740481
Mean1.900037329e+11
Median Absolute Deviation (MAD)1206787.5
Skewness-0.02656166832
Sum4.028459144e+15
Variance2.181650599e+12
Histogram with fixed size bins (bins=10)
ValueCountFrequency (%) 
1.900026409e+111< 0.1%
 
1.900026723e+111< 0.1%
 
1.90005923e+111< 0.1%
 
1.900017916e+111< 0.1%
 
1.900059634e+111< 0.1%
 
1.900047935e+111< 0.1%
 
1.900059664e+111< 0.1%
 
1.90001724e+111< 0.1%
 
1.900048864e+111< 0.1%
 
1.900038499e+111< 0.1%
 
Other values (21192)21192> 99.9%
 
ValueCountFrequency (%) 
1.900010436e+111< 0.1%
 
1.900016848e+111< 0.1%
 
1.900016848e+111< 0.1%
 
1.900016848e+111< 0.1%
 
1.900016848e+111< 0.1%
 
ValueCountFrequency (%) 
1.900061192e+111< 0.1%
 
1.900061191e+111< 0.1%
 
1.900061191e+111< 0.1%
 
1.900061178e+111< 0.1%
 
1.900061178e+111< 0.1%
 

NU_IDADE
Real number (ℝ≥0)

Distinct count62
Unique (%)0.3%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean22.30266012640317
Minimum13
Maximum77
Zeros0
Zeros (%)0.0%
Memory size165.6 KiB

Quantile statistics

Minimum13
5-th percentile17
Q118
median19
Q323
95-th percentile40
Maximum77
Range64
Interquartile range (IQR)5

Descriptive statistics

Standard deviation8.028488113
Coefficient of variation (CV)0.3599789473
Kurtosis7.203634055
Mean22.30266013
Median Absolute Deviation (MAD)2
Skewness2.551984968
Sum472861
Variance64.45662138
Histogram with fixed size bins (bins=10)
ValueCountFrequency (%) 
18469922.2%
 
17292413.8%
 
19271612.8%
 
2018168.6%
 
2112706.0%
 
229434.4%
 
168854.2%
 
237723.6%
 
246042.8%
 
255202.5%
 
Other values (52)405319.1%
 
ValueCountFrequency (%) 
132< 0.1%
 
151070.5%
 
168854.2%
 
17292413.8%
 
18469922.2%
 
ValueCountFrequency (%) 
771< 0.1%
 
741< 0.1%
 
732< 0.1%
 
722< 0.1%
 
713< 0.1%
 

TP_SEXO
Categorical

Distinct count2
Unique (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
F
12409
M
8793
ValueCountFrequency (%) 
F1240958.5%
 
M879341.5%
 

Length

Max length1
Median length1
Mean length1
Min length1

TP_ESTADO_CIVIL
Categorical

Distinct count5
Unique (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
Solteiro(a)
18896
Não informado
 
1063
Casado(a)/Mora com companheiro(a)
 
818
Divorciado(a)/Desquitado(a)/Separado(a)
 
399
Viúvo(a)
 
26
ValueCountFrequency (%) 
Solteiro(a)1889689.1%
 
Não informado10635.0%
 
Casado(a)/Mora com companheiro(a)8183.9%
 
Divorciado(a)/Desquitado(a)/Separado(a)3991.9%
 
Viúvo(a)260.1%
 

Length

Max length39
Median length11
Mean length12.47231393
Min length8

TP_COR_RACA
Categorical

Distinct count6
Unique (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
Branca
15473
Preta
 
2580
Parda
 
2574
Não declarado
 
448
Amarela
 
87
ValueCountFrequency (%) 
Branca1547373.0%
 
Preta258012.2%
 
Parda257412.1%
 
Não declarado4482.1%
 
Amarela870.4%
 
Indígena400.2%
 

Length

Max length13
Median length6
Mean length5.912696915
Min length5

TP_NACIONALIDADE
Categorical

Distinct count5
Unique (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
Brasileiro(a)
20756
Brasileiro(a) Naturalizado(a)
 
309
Estrangeiro(a)
 
61
Brasileiro(a) Nato(a), nascido(a) no exterior
 
54
Não informado
 
22
ValueCountFrequency (%) 
Brasileiro(a)2075697.9%
 
Brasileiro(a) Naturalizado(a)3091.5%
 
Estrangeiro(a)610.3%
 
Brasileiro(a) Nato(a), nascido(a) no exterior540.3%
 
Não informado220.1%
 

Length

Max length45
Median length13
Mean length13.31756438
Min length13

SG_UF_NASCIMENTO
Categorical

Distinct count28
Unique (%)0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
RS
19730
missing value
 
446
SP
 
168
SC
 
139
RJ
 
122
Other values (23)
 
597
ValueCountFrequency (%) 
RS1973093.1%
 
missing value4462.1%
 
SP1680.8%
 
SC1390.7%
 
RJ1220.6%
 
PR1090.5%
 
MG560.3%
 
PA530.2%
 
BA380.2%
 
CE370.2%
 
Other values (18)3041.4%
 

Length

Max length13
Median length2
Mean length2.231393265
Min length2

TP_ST_CONCLUSAO
Categorical

HIGH CORRELATION

Distinct count4
Unique (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
Já concluí o Ensino Médio
12026
Estou cursando e concluirei o Ensino Médio em 2019
6419
Estou cursando e concluirei o Ensino Médio após 2019
2706
Não concluí e não estou cursando o Ensino Médio
 
51
ValueCountFrequency (%) 
Já concluí o Ensino Médio1202656.7%
 
Estou cursando e concluirei o Ensino Médio em 2019641930.3%
 
Estou cursando e concluirei o Ensino Médio após 2019270612.8%
 
Não concluí e não estou cursando o Ensino Médio510.2%
 

Length

Max length52
Median length25
Mean length36.06777662
Min length25

TP_ANO_CONCLUIU
Categorical

Distinct count14
Unique (%)0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
Não informado
9805
2018
2095
2017
2093
Antes de 2007
 
1752
2016
 
1368
Other values (9)
4089
ValueCountFrequency (%) 
Não informado980546.2%
 
201820959.9%
 
201720939.9%
 
Antes de 200717528.3%
 
201613686.5%
 
20159874.7%
 
20148073.8%
 
20135602.6%
 
20124252.0%
 
20113381.6%
 
Other values (4)9724.6%
 

Length

Max length13
Median length13
Mean length8.905810773
Min length4

TP_ESCOLA
Categorical

Distinct count3
Unique (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
Não Respondeu
14783
Pública
3933
Privada
 
2486
ValueCountFrequency (%) 
Não Respondeu1478369.7%
 
Pública393318.6%
 
Privada248611.7%
 

Length

Max length13
Median length13
Mean length11.18347326
Min length7

TP_ENSINO
Categorical

Distinct count3
Unique (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
missing value
11877
Ensino Regular
9282
Educação Especial - Modalidade Substitutiva
 
43
ValueCountFrequency (%) 
missing value1187756.0%
 
Ensino Regular928243.8%
 
Educação Especial - Modalidade Substitutiva430.2%
 

Length

Max length43
Median length13
Mean length13.4986322
Min length13

IN_TREINEIRO
Categorical

HIGH CORRELATION

Distinct count2
Unique (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
Não
18496
Sim
 
2706
ValueCountFrequency (%) 
Não1849687.2%
 
Sim270612.8%
 

Length

Max length3
Median length3
Mean length3
Min length3
Distinct count5
Unique (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
missing value
16553
Estadual
 
2622
Privada
 
1856
Federal
 
141
Municipal
 
30
ValueCountFrequency (%) 
missing value1655378.1%
 
Estadual262212.4%
 
Privada18568.8%
 
Federal1410.7%
 
Municipal300.1%
 

Length

Max length13
Median length13
Mean length11.8108669
Min length7
Distinct count3
Unique (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
missing value
16553
Urbana
4646
Rural
 
3
ValueCountFrequency (%) 
missing value1655378.1%
 
Urbana464621.9%
 
Rural3< 0.1%
 

Length

Max length13
Median length13
Mean length11.46495614
Min length5

TP_SIT_FUNC_ESC
Categorical

Distinct count4
Unique (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
missing value
16553
Em atividade
4644
4.0
 
4
Paralisada
 
1
ValueCountFrequency (%) 
missing value1655378.1%
 
Em atividade464421.9%
 
4.04< 0.1%
 
Paralisada1< 0.1%
 

Length

Max length13
Median length13
Mean length12.77893595
Min length3

IN_SURDEZ
Categorical

Distinct count2
Unique (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
Não
21194
Sim
 
8
ValueCountFrequency (%) 
Não21194> 99.9%
 
Sim8< 0.1%
 

Length

Max length3
Median length3
Mean length3
Min length3

IN_SURDO_CEGUEIRA
Categorical

CONSTANT
REJECTED

Distinct count1
Unique (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
Não
21202
ValueCountFrequency (%) 
Não21202100.0%
 

Length

Max length3
Median length3
Mean length3
Min length3
Distinct count2
Unique (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
Não
21166
Sim
 
36
ValueCountFrequency (%) 
Não2116699.8%
 
Sim360.2%
 

Length

Max length3
Median length3
Mean length3
Min length3
Distinct count2
Unique (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
Não
21196
Sim
 
6
ValueCountFrequency (%) 
Não21196> 99.9%
 
Sim6< 0.1%
 

Length

Max length3
Median length3
Mean length3
Min length3
Distinct count2
Unique (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
Não
21112
Sim
 
90
ValueCountFrequency (%) 
Não2111299.6%
 
Sim900.4%
 

Length

Max length3
Median length3
Mean length3
Min length3

IN_DISLEXIA
Categorical

Distinct count2
Unique (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
Não
21191
Sim
 
11
ValueCountFrequency (%) 
Não2119199.9%
 
Sim110.1%
 

Length

Max length3
Median length3
Mean length3
Min length3

IN_DISCALCULIA
Categorical

Distinct count2
Unique (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
Não
21194
Sim
 
8
ValueCountFrequency (%) 
Não21194> 99.9%
 
Sim8< 0.1%
 

Length

Max length3
Median length3
Mean length3
Min length3

IN_AUTISMO
Categorical

Distinct count2
Unique (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
Não
21192
Sim
 
10
ValueCountFrequency (%) 
Não21192> 99.9%
 
Sim10< 0.1%
 

Length

Max length3
Median length3
Mean length3
Min length3

IN_GESTANTE
Categorical

Distinct count2
Unique (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
Não
21201
Sim
 
1
ValueCountFrequency (%) 
Não21201> 99.9%
 
Sim1< 0.1%
 

Length

Max length3
Median length3
Mean length3
Min length3

NU_NOTA_CN
Real number (ℝ≥0)

Distinct count3496
Unique (%)16.5%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean506.70531553627023
Minimum0.0
Maximum793.1
Zeros5
Zeros (%)< 0.1%
Memory size165.6 KiB

Quantile statistics

Minimum0
5-th percentile379.51
Q1445.4
median509.2
Q3565
95-th percentile633.9
Maximum793.1
Range793.1
Interquartile range (IQR)119.6

Descriptive statistics

Standard deviation79.45574755
Coefficient of variation (CV)0.1568085929
Kurtosis-0.2394397488
Mean506.7053155
Median Absolute Deviation (MAD)59.7
Skewness0.02686793599
Sum10743166.1
Variance6313.215819
Histogram with fixed size bins (bins=10)
ValueCountFrequency (%) 
552.8230.1%
 
568.4200.1%
 
511.2200.1%
 
475.8190.1%
 
521.8180.1%
 
558.1170.1%
 
504.3170.1%
 
490170.1%
 
566.1170.1%
 
457.7170.1%
 
Other values (3486)2101799.1%
 
ValueCountFrequency (%) 
05< 0.1%
 
327.91< 0.1%
 
328.21< 0.1%
 
329.11< 0.1%
 
329.91< 0.1%
 
ValueCountFrequency (%) 
793.11< 0.1%
 
781.71< 0.1%
 
776.51< 0.1%
 
770.61< 0.1%
 
766.21< 0.1%
 

NU_NOTA_CH
Real number (ℝ≥0)

Distinct count3671
Unique (%)17.3%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean550.6986133383643
Minimum0.0
Maximum784.1
Zeros12
Zeros (%)0.1%
Memory size165.6 KiB

Quantile statistics

Minimum0
5-th percentile407.61
Q1502.2
median558.5
Q3605.1
95-th percentile669.3
Maximum784.1
Range784.1
Interquartile range (IQR)102.9

Descriptive statistics

Standard deviation78.93613162
Coefficient of variation (CV)0.1433381703
Kurtosis1.048989161
Mean550.6986133
Median Absolute Deviation (MAD)50.9
Skewness-0.5145783096
Sum11675912
Variance6230.912875
Histogram with fixed size bins (bins=10)
ValueCountFrequency (%) 
559220.1%
 
588.3220.1%
 
573.7210.1%
 
553.6210.1%
 
585.7210.1%
 
591.2210.1%
 
572210.1%
 
571.4200.1%
 
562.4200.1%
 
592.9200.1%
 
Other values (3661)2099399.0%
 
ValueCountFrequency (%) 
0120.1%
 
315.94< 0.1%
 
316.71< 0.1%
 
318.71< 0.1%
 
320.81< 0.1%
 
ValueCountFrequency (%) 
784.11< 0.1%
 
781.41< 0.1%
 
7811< 0.1%
 
780.71< 0.1%
 
779.91< 0.1%
 

NU_NOTA_LC
Real number (ℝ≥0)

Distinct count2879
Unique (%)13.6%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean555.1984482595982
Minimum0.0
Maximum731.2
Zeros2
Zeros (%)< 0.1%
Memory size165.6 KiB

Quantile statistics

Minimum0
5-th percentile453.2
Q1522.8
median561.6
Q3593
95-th percentile636.2
Maximum731.2
Range731.2
Interquartile range (IQR)70.2

Descriptive statistics

Standard deviation56.2227691
Coefficient of variation (CV)0.1012660775
Kurtosis1.617317383
Mean555.1984483
Median Absolute Deviation (MAD)34.7
Skewness-0.7131395904
Sum11771317.5
Variance3160.999765
Histogram with fixed size bins (bins=10)
ValueCountFrequency (%) 
563.4290.1%
 
574.3270.1%
 
591.9270.1%
 
597260.1%
 
582.7260.1%
 
581.9260.1%
 
570.4260.1%
 
577.8250.1%
 
575250.1%
 
572250.1%
 
Other values (2869)2094098.8%
 
ValueCountFrequency (%) 
02< 0.1%
 
322.71< 0.1%
 
323.21< 0.1%
 
324.11< 0.1%
 
324.71< 0.1%
 
ValueCountFrequency (%) 
731.21< 0.1%
 
730.41< 0.1%
 
729.81< 0.1%
 
722.31< 0.1%
 
720.51< 0.1%
 

NU_NOTA_MT
Real number (ℝ≥0)

Distinct count4744
Unique (%)22.4%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean567.9710734836336
Minimum0.0
Maximum985.5
Zeros6
Zeros (%)< 0.1%
Memory size165.6 KiB

Quantile statistics

Minimum0
5-th percentile393.505
Q1466.8
median562.7
Q3656.5
95-th percentile774.395
Maximum985.5
Range985.5
Interquartile range (IQR)189.7

Descriptive statistics

Standard deviation120.5750959
Coefficient of variation (CV)0.2122909098
Kurtosis-0.5732117943
Mean567.9710735
Median Absolute Deviation (MAD)95.1
Skewness0.2854519719
Sum12042122.7
Variance14538.35376
Histogram with fixed size bins (bins=10)
ValueCountFrequency (%) 
406.1150.1%
 
438.2150.1%
 
444.9140.1%
 
617.1140.1%
 
470.8130.1%
 
454.3130.1%
 
530.3130.1%
 
523.8130.1%
 
616.8130.1%
 
585.8130.1%
 
Other values (4734)2106699.4%
 
ValueCountFrequency (%) 
06< 0.1%
 
3596< 0.1%
 
359.22< 0.1%
 
359.33< 0.1%
 
359.41< 0.1%
 
ValueCountFrequency (%) 
985.51< 0.1%
 
9851< 0.1%
 
975.21< 0.1%
 
965.11< 0.1%
 
963.61< 0.1%
 

TP_LINGUA
Categorical

Distinct count2
Unique (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
Inglês
11931
Espanhol
9271
ValueCountFrequency (%) 
Inglês1193156.3%
 
Espanhol927143.7%
 

Length

Max length8
Median length6
Mean length6.874540138
Min length6
Distinct count8
Unique (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
Sem problemas
20802
Em Branco
 
215
Fuga ao tema
 
81
Cópia Texto Motivador
 
28
Texto insuficiente
 
25
Other values (3)
 
51
ValueCountFrequency (%) 
Sem problemas2080298.1%
 
Em Branco2151.0%
 
Fuga ao tema810.4%
 
Cópia Texto Motivador280.1%
 
Texto insuficiente250.1%
 
Anulada200.1%
 
Parte desconectada170.1%
 
Não atendimento ao tipo textual140.1%
 

Length

Max length31
Median length13
Mean length12.98231299
Min length7

NU_NOTA_COMP1
Real number (ℝ≥0)

ZEROS

Distinct count11
Unique (%)0.1%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean131.1263088387888
Minimum0.0
Maximum200.0
Zeros400
Zeros (%)1.9%
Memory size165.6 KiB

Quantile statistics

Minimum0
5-th percentile100
Q1120
median120
Q3160
95-th percentile160
Maximum200
Range200
Interquartile range (IQR)40

Descriptive statistics

Standard deviation29.52040571
Coefficient of variation (CV)0.2251295409
Kurtosis5.443184051
Mean131.1263088
Median Absolute Deviation (MAD)20
Skewness-1.491550713
Sum2780140
Variance871.4543533
Histogram with fixed size bins (bins=10)
ValueCountFrequency (%) 
120817638.6%
 
160537425.3%
 
140394818.6%
 
10018468.7%
 
1807413.5%
 
805682.7%
 
04001.9%
 
2001020.5%
 
60390.2%
 
407< 0.1%
 
ValueCountFrequency (%) 
04001.9%
 
201< 0.1%
 
407< 0.1%
 
60390.2%
 
805682.7%
 
ValueCountFrequency (%) 
2001020.5%
 
1807413.5%
 
160537425.3%
 
140394818.6%
 
120817638.6%
 

NU_NOTA_COMP2
Real number (ℝ≥0)

ZEROS

Distinct count10
Unique (%)< 0.1%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean130.1377228563343
Minimum0.0
Maximum200.0
Zeros400
Zeros (%)1.9%
Memory size165.6 KiB

Quantile statistics

Minimum0
5-th percentile40
Q1120
median120
Q3160
95-th percentile200
Maximum200
Range200
Interquartile range (IQR)40

Descriptive statistics

Standard deviation39.89455812
Coefficient of variation (CV)0.3065564484
Kurtosis1.542219964
Mean130.1377229
Median Absolute Deviation (MAD)0
Skewness-0.5179253134
Sum2759180
Variance1591.575768
Histogram with fixed size bins (bins=10)
ValueCountFrequency (%) 
1201159154.7%
 
200213410.1%
 
16017048.0%
 
14016958.0%
 
18016427.7%
 
409154.3%
 
1006343.0%
 
04001.9%
 
803371.6%
 
601500.7%
 
ValueCountFrequency (%) 
04001.9%
 
409154.3%
 
601500.7%
 
803371.6%
 
1006343.0%
 
ValueCountFrequency (%) 
200213410.1%
 
18016427.7%
 
16017048.0%
 
14016958.0%
 
1201159154.7%
 

NU_NOTA_COMP3
Real number (ℝ≥0)

HIGH CORRELATION
ZEROS

Distinct count11
Unique (%)0.1%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean124.7099330251863
Minimum0.0
Maximum200.0
Zeros402
Zeros (%)1.9%
Memory size165.6 KiB

Quantile statistics

Minimum0
5-th percentile40
Q1120
median120
Q3140
95-th percentile180
Maximum200
Range200
Interquartile range (IQR)20

Descriptive statistics

Standard deviation37.95368678
Coefficient of variation (CV)0.3043357161
Kurtosis1.478566227
Mean124.709933
Median Absolute Deviation (MAD)20
Skewness-0.695863685
Sum2644100
Variance1440.48234
Histogram with fixed size bins (bins=10)
ValueCountFrequency (%) 
120818738.6%
 
140309114.6%
 
160287513.6%
 
100227210.7%
 
18013246.2%
 
8010474.9%
 
408584.0%
 
2008363.9%
 
04021.9%
 
602981.4%
 
ValueCountFrequency (%) 
04021.9%
 
20120.1%
 
408584.0%
 
602981.4%
 
8010474.9%
 
ValueCountFrequency (%) 
2008363.9%
 
18013246.2%
 
160287513.6%
 
140309114.6%
 
120818738.6%
 

NU_NOTA_COMP4
Real number (ℝ≥0)

ZEROS

Distinct count11
Unique (%)0.1%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean129.059522686539
Minimum0.0
Maximum200.0
Zeros400
Zeros (%)1.9%
Memory size165.6 KiB

Quantile statistics

Minimum0
5-th percentile80
Q1120
median120
Q3160
95-th percentile200
Maximum200
Range200
Interquartile range (IQR)40

Descriptive statistics

Standard deviation35.10860123
Coefficient of variation (CV)0.2720341785
Kurtosis2.226357041
Mean129.0595227
Median Absolute Deviation (MAD)20
Skewness-0.450943454
Sum2736320
Variance1232.613881
Histogram with fixed size bins (bins=10)
ValueCountFrequency (%) 
120868541.0%
 
140277613.1%
 
160270512.8%
 
100267412.6%
 
18014246.7%
 
20012495.9%
 
8011215.3%
 
04001.9%
 
601410.7%
 
40240.1%
 
ValueCountFrequency (%) 
04001.9%
 
203< 0.1%
 
40240.1%
 
601410.7%
 
8011215.3%
 
ValueCountFrequency (%) 
20012495.9%
 
18014246.7%
 
160270512.8%
 
140277613.1%
 
120868541.0%
 

NU_NOTA_COMP5
Real number (ℝ≥0)

ZEROS

Distinct count11
Unique (%)0.1%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean105.95698519007641
Minimum0.0
Maximum200.0
Zeros2558
Zeros (%)12.1%
Memory size165.6 KiB

Quantile statistics

Minimum0
5-th percentile0
Q180
median120
Q3140
95-th percentile200
Maximum200
Range200
Interquartile range (IQR)60

Descriptive statistics

Standard deviation57.93745653
Coefficient of variation (CV)0.5468016707
Kurtosis-0.6962138602
Mean105.9569852
Median Absolute Deviation (MAD)40
Skewness-0.3816651246
Sum2246500
Variance3356.748869
Histogram with fixed size bins (bins=10)
ValueCountFrequency (%) 
120361217.0%
 
0255812.1%
 
80251311.9%
 
100248711.7%
 
160246311.6%
 
140237111.2%
 
18014536.9%
 
20013656.4%
 
609624.5%
 
408343.9%
 
ValueCountFrequency (%) 
0255812.1%
 
205842.8%
 
408343.9%
 
609624.5%
 
80251311.9%
 
ValueCountFrequency (%) 
20013656.4%
 
18014536.9%
 
160246311.6%
 
140237111.2%
 
120361217.0%
 

NU_NOTA_REDACAO
Real number (ℝ≥0)

HIGH CORRELATION
ZEROS

Distinct count45
Unique (%)0.2%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean620.9904725969249
Minimum0.0
Maximum980.0
Zeros400
Zeros (%)1.9%
Memory size165.6 KiB

Quantile statistics

Minimum0
5-th percentile320
Q1540
median620
Q3720
95-th percentile900
Maximum980
Range980
Interquartile range (IQR)180

Descriptive statistics

Standard deviation174.9668145
Coefficient of variation (CV)0.2817544265
Kurtosis1.670430955
Mean620.9904726
Median Absolute Deviation (MAD)100
Skewness-0.6670422007
Sum13166240
Variance30613.38616
Histogram with fixed size bins (bins=10)
ValueCountFrequency (%) 
60015667.4%
 
56013746.5%
 
64012916.1%
 
58012676.0%
 
62011505.4%
 
5409674.6%
 
5208964.2%
 
6808794.1%
 
6608454.0%
 
7207613.6%
 
Other values (35)1020648.1%
 
ValueCountFrequency (%) 
04001.9%
 
801< 0.1%
 
1401< 0.1%
 
1603< 0.1%
 
1801< 0.1%
 
ValueCountFrequency (%) 
980930.4%
 
9602351.1%
 
9403041.4%
 
9203681.7%
 
9003261.5%
 

Q001
Categorical

Distinct count8
Unique (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
Completou o Ensino Médio, mas não completou a Faculdade.
6883
Completou a Faculdade, mas não completou a Pós-graduação.
3045
Completou a Pós-graduação.
2394
Não completou a 4ª série/5º ano do Ensino Fundamental.
2371
Completou a 8ª série/9º ano do Ensino Fundamental, mas não completou o Ensino Médio.
2350
Other values (3)
4159
ValueCountFrequency (%) 
Completou o Ensino Médio, mas não completou a Faculdade.688332.5%
 
Completou a Faculdade, mas não completou a Pós-graduação.304514.4%
 
Completou a Pós-graduação.239411.3%
 
Não completou a 4ª série/5º ano do Ensino Fundamental.237111.2%
 
Completou a 8ª série/9º ano do Ensino Fundamental, mas não completou o Ensino Médio.235011.1%
 
Completou a 4ª série/5º ano, mas não completou a 8ª série/9º ano do Ensino Fundamental.223610.5%
 
Não sei.16427.7%
 
Nunca estudou.2811.3%
 

Length

Max length87
Median length56
Mean length54.63130837
Min length8

Q002
Categorical

Distinct count8
Unique (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
Completou o Ensino Médio, mas não completou a Faculdade.
7731
Completou a Faculdade, mas não completou a Pós-graduação.
3489
Completou a Pós-graduação.
2997
Completou a 8ª série/9º ano do Ensino Fundamental, mas não completou o Ensino Médio.
2488
Completou a 4ª série/5º ano, mas não completou a 8ª série/9º ano do Ensino Fundamental.
2002
Other values (3)
2495
ValueCountFrequency (%) 
Completou o Ensino Médio, mas não completou a Faculdade.773136.5%
 
Completou a Faculdade, mas não completou a Pós-graduação.348916.5%
 
Completou a Pós-graduação.299714.1%
 
Completou a 8ª série/9º ano do Ensino Fundamental, mas não completou o Ensino Médio.248811.7%
 
Completou a 4ª série/5º ano, mas não completou a 8ª série/9º ano do Ensino Fundamental.20029.4%
 
Não completou a 4ª série/5º ano do Ensino Fundamental.19039.0%
 
Não sei.3631.7%
 
Nunca estudou.2291.1%
 

Length

Max length87
Median length56
Mean length56.68186963
Min length8

Q006
Categorical

Distinct count17
Unique (%)0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
1 a 1.5 SM
4030
2 a 2.5 SM
2349
1.5 a 2 SM
2244
3 a 4 SM
 
1783
1 SM
 
1760
Other values (12)
9036
ValueCountFrequency (%) 
1 a 1.5 SM403019.0%
 
2 a 2.5 SM234911.1%
 
1.5 a 2 SM224410.6%
 
3 a 4 SM17838.4%
 
1 SM17608.3%
 
2.5 a 3 SM13806.5%
 
4 a 5 SM13646.4%
 
5 a 6 SM10464.9%
 
Mais de 20 SM9654.6%
 
10 a 12 SM7373.5%
 
Other values (7)354416.7%
 

Length

Max length14
Median length10
Mean length9.13107254
Min length4

Q025
Categorical

Distinct count2
Unique (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size165.6 KiB
Sim
18964
Não
 
2238
ValueCountFrequency (%) 
Sim1896489.4%
 
Não223810.6%
 

Length

Max length3
Median length3
Mean length3
Min length3

Interactions

Correlations

Pearson's r

The Pearson's correlation coefficient (r) is a measure of linear correlation between two variables. It's value lies between -1 and +1, -1 indicating total negative linear correlation, 0 indicating no linear correlation and 1 indicating total positive linear correlation. Furthermore, r is invariant under separate changes in location and scale of the two variables, implying that for a linear function the angle to the x-axis does not affect r.

To calculate r for two variables X and Y, one divides the covariance of X and Y by the product of their standard deviations.

Spearman's ρ

The Spearman's rank correlation coefficient (ρ) is a measure of monotonic correlation between two variables, and is therefore better in catching nonlinear monotonic correlations than Pearson's r. It's value lies between -1 and +1, -1 indicating total negative monotonic correlation, 0 indicating no monotonic correlation and 1 indicating total positive monotonic correlation.

To calculate ρ for two variables X and Y, one divides the covariance of the rank variables of X and Y by the product of their standard deviations.

Kendall's τ

Similarly to Spearman's rank correlation coefficient, the Kendall rank correlation coefficient (τ) measures ordinal association between two variables. It's value lies between -1 and +1, -1 indicating total negative correlation, 0 indicating no correlation and 1 indicating total positive correlation.

To calculate τ for two variables X and Y, one determines the number of concordant and discordant pairs of observations. τ is given by the number of concordant pairs minus the discordant pairs divided by the total number of pairs.

Phik (φk)

Phik (φk) is a new and practical correlation coefficient that works consistently between categorical, ordinal and interval variables, captures non-linear dependency and reverts to the Pearson correlation coefficient in case of a bivariate normal input distribution. There is extensive documentation available here.

Cramér's V (φc)

Cramér's V is an association measure for nominal random variables. The coefficient ranges from 0 to 1, with 0 indicating independence and 1 indicating perfect association. The empirical estimators used for Cramér's V have been proved to be biased, even for large samples. We use a bias-corrected measure that has been proposed by Bergsma in 2013 that can be found here.

Missing values

Sample

First rows

NU_INSCRICAONU_IDADETP_SEXOTP_ESTADO_CIVILTP_COR_RACATP_NACIONALIDADESG_UF_NASCIMENTOTP_ST_CONCLUSAOTP_ANO_CONCLUIUTP_ESCOLATP_ENSINOIN_TREINEIROTP_DEPENDENCIA_ADM_ESCTP_LOCALIZACAO_ESCTP_SIT_FUNC_ESCIN_SURDEZIN_SURDO_CEGUEIRAIN_DEFICIENCIA_FISICAIN_DEFICIENCIA_MENTALIN_DEFICIT_ATENCAOIN_DISLEXIAIN_DISCALCULIAIN_AUTISMOIN_GESTANTENU_NOTA_CNNU_NOTA_CHNU_NOTA_LCNU_NOTA_MTTP_LINGUATP_STATUS_REDACAONU_NOTA_COMP1NU_NOTA_COMP2NU_NOTA_COMP3NU_NOTA_COMP4NU_NOTA_COMP5NU_NOTA_REDACAOQ001Q002Q006Q025
019000104364819MSolteiro(a)PardaBrasileiro(a)RSJá concluí o Ensino Médio2018Não Respondeumissing valueNãomissing valuemissing valuemissing valueNãoNãoNãoNãoNãoNãoNãoNãoNão498.0582.1544.5680.7EspanholSem problemas140.0120.0180.0160.0160.0760.0Completou a Pós-graduação.Completou a Faculdade, mas não completou a Pós-graduação.9 a 10 SMSim
119000168476535FCasado(a)/Mora com companheiro(a)BrancaBrasileiro(a)RSJá concluí o Ensino MédioAntes de 2007Não RespondeuEnsino RegularNãomissing valuemissing valuemissing valueNãoNãoNãoNãoNãoNãoNãoNãoNão495.0538.5546.8367.3EspanholSem problemas120.0160.0120.0120.0120.0640.0Completou a 8ª série/9º ano do Ensino Fundamental, mas não completou o Ensino Médio.Completou a 4ª série/5º ano, mas não completou a 8ª série/9º ano do Ensino Fundamental.1 SMSim
219000168477418FNão informadoBrancaBrasileiro(a)RSEstou cursando e concluirei o Ensino Médio em 2019Não informadoPúblicaEnsino RegularNãomissing valuemissing valuemissing valueNãoNãoNãoNãoNãoNãoNãoNãoNão460.4529.1526.9412.6InglêsSem problemas120.0140.0120.0140.0140.0660.0Completou o Ensino Médio, mas não completou a Faculdade.Completou o Ensino Médio, mas não completou a Faculdade.2.5 a 3 SMSim
319000168477924MSolteiro(a)BrancaBrasileiro(a)RSJá concluí o Ensino Médio2014Não Respondeumissing valueNãomissing valuemissing valuemissing valueNãoNãoNãoNãoNãoNãoNãoNãoNão477.3464.7535.7659.7InglêsSem problemas160.0180.0160.0160.0140.0800.0Não completou a 4ª série/5º ano do Ensino Fundamental.Completou o Ensino Médio, mas não completou a Faculdade.1 SMSim
419000168479320FSolteiro(a)BrancaBrasileiro(a)RSJá concluí o Ensino Médio2017Não RespondeuEnsino RegularNãomissing valuemissing valuemissing valueNãoNãoNãoNãoNãoNãoNãoNãoNão465.3537.0557.6393.6InglêsSem problemas140.0120.0120.0120.0120.0620.0Completou o Ensino Médio, mas não completou a Faculdade.Completou a 8ª série/9º ano do Ensino Fundamental, mas não completou o Ensino Médio.2 a 2.5 SMSim
519000168479718MSolteiro(a)BrancaBrasileiro(a)RSEstou cursando e concluirei o Ensino Médio em 2019Não informadoPúblicaEnsino RegularNãoEstadualUrbanaEm atividadeNãoNãoNãoNãoNãoNãoNãoNãoNão444.0537.0545.5655.8InglêsSem problemas100.0120.0120.0120.080.0540.0Completou a 4ª série/5º ano, mas não completou a 8ª série/9º ano do Ensino Fundamental.Completou a 8ª série/9º ano do Ensino Fundamental, mas não completou o Ensino Médio.2.5 a 3 SMSim
619000168480217FSolteiro(a)BrancaBrasileiro(a)RSEstou cursando e concluirei o Ensino Médio após 2019Não informadoNão Respondeumissing valueSimmissing valuemissing valuemissing valueNãoNãoNãoNãoNãoNãoNãoNãoNão377.5543.4540.9409.4EspanholSem problemas160.0120.0140.0180.0100.0700.0Completou o Ensino Médio, mas não completou a Faculdade.Completou a 4ª série/5º ano, mas não completou a 8ª série/9º ano do Ensino Fundamental.1.5 a 2 SMSim
719000168480318FSolteiro(a)BrancaBrasileiro(a)RSEstou cursando e concluirei o Ensino Médio em 2019Não informadoPrivadaEnsino RegularNãoPrivadaUrbanaEm atividadeNãoNãoNãoNãoNãoNãoNãoNãoNão561.5554.5522.8470.3InglêsSem problemas140.0140.0120.0160.0120.0680.0Completou a Pós-graduação.Completou a Pós-graduação.Mais de 20 SMSim
819000168481021FSolteiro(a)BrancaBrasileiro(a)RSJá concluí o Ensino Médio2015Não Respondeumissing valueNãomissing valuemissing valuemissing valueNãoNãoNãoNãoNãoNãoNãoNãoNão573.4579.8634.7742.5EspanholSem problemas120.0200.0160.0160.0140.0780.0Completou a 4ª série/5º ano, mas não completou a 8ª série/9º ano do Ensino Fundamental.Completou a Pós-graduação.5 a 6 SMSim
919000168481617FSolteiro(a)BrancaBrasileiro(a)RSEstou cursando e concluirei o Ensino Médio após 2019Não informadoNão Respondeumissing valueSimmissing valuemissing valuemissing valueNãoNãoNãoNãoNãoNãoNãoNãoNão385.2553.6559.8492.6EspanholSem problemas140.0120.0120.0120.080.0580.0Completou o Ensino Médio, mas não completou a Faculdade.Completou o Ensino Médio, mas não completou a Faculdade.2.5 a 3 SMSim

Last rows

NU_INSCRICAONU_IDADETP_SEXOTP_ESTADO_CIVILTP_COR_RACATP_NACIONALIDADESG_UF_NASCIMENTOTP_ST_CONCLUSAOTP_ANO_CONCLUIUTP_ESCOLATP_ENSINOIN_TREINEIROTP_DEPENDENCIA_ADM_ESCTP_LOCALIZACAO_ESCTP_SIT_FUNC_ESCIN_SURDEZIN_SURDO_CEGUEIRAIN_DEFICIENCIA_FISICAIN_DEFICIENCIA_MENTALIN_DEFICIT_ATENCAOIN_DISLEXIAIN_DISCALCULIAIN_AUTISMOIN_GESTANTENU_NOTA_CNNU_NOTA_CHNU_NOTA_LCNU_NOTA_MTTP_LINGUATP_STATUS_REDACAONU_NOTA_COMP1NU_NOTA_COMP2NU_NOTA_COMP3NU_NOTA_COMP4NU_NOTA_COMP5NU_NOTA_REDACAOQ001Q002Q006Q025
2119219000611328143FSolteiro(a)BrancaBrasileiro(a)RSJá concluí o Ensino MédioAntes de 2007Não RespondeuEnsino RegularNãomissing valuemissing valuemissing valueNãoNãoNãoNãoNãoNãoNãoNãoNão452.9519.2479.0411.3EspanholSem problemas100.040.040.0100.020.0300.0Completou a 4ª série/5º ano, mas não completou a 8ª série/9º ano do Ensino Fundamental.Completou a 4ª série/5º ano, mas não completou a 8ª série/9º ano do Ensino Fundamental.1 a 1.5 SMSim
2119319000611481421FDivorciado(a)/Desquitado(a)/Separado(a)PardaBrasileiro(a)RSJá concluí o Ensino Médio2018Não RespondeuEnsino RegularNãomissing valuemissing valuemissing valueNãoNãoNãoNãoNãoNãoNãoNãoNão453.1412.9466.0475.6EspanholSem problemas100.040.040.0100.020.0300.0Não completou a 4ª série/5º ano do Ensino Fundamental.Completou a 4ª série/5º ano, mas não completou a 8ª série/9º ano do Ensino Fundamental.1 SMNão
2119419000611633017FSolteiro(a)BrancaBrasileiro(a)RSEstou cursando e concluirei o Ensino Médio em 2019Não informadoPúblicaEnsino RegularNãoEstadualUrbanaEm atividadeNãoNãoNãoNãoNãoNãoNãoNãoNão445.0567.2483.4501.7EspanholSem problemas140.0120.0120.0140.0140.0660.0Completou a 8ª série/9º ano do Ensino Fundamental, mas não completou o Ensino Médio.Completou o Ensino Médio, mas não completou a Faculdade.1.5 a 2 SMSim
2119519000611773021MSolteiro(a)PretaBrasileiro(a)RSJá concluí o Ensino Médio2016Não RespondeuEnsino RegularNãomissing valuemissing valuemissing valueNãoNãoNãoNãoNãoNãoNãoNãoNão513.9476.0548.3456.1EspanholSem problemas120.040.040.0120.00.0320.0Completou a 8ª série/9º ano do Ensino Fundamental, mas não completou o Ensino Médio.Completou a 8ª série/9º ano do Ensino Fundamental, mas não completou o Ensino Médio.2.5 a 3 SMSim
2119619000611775718FSolteiro(a)PretaBrasileiro(a)RSEstou cursando e concluirei o Ensino Médio em 2019Não informadoPúblicaEnsino RegularNãoEstadualUrbanaEm atividadeNãoNãoNãoNãoNãoNãoNãoNãoNão563.7608.7629.2626.4InglêsSem problemas160.0140.0160.0140.0120.0720.0Completou o Ensino Médio, mas não completou a Faculdade.Completou a Faculdade, mas não completou a Pós-graduação.4 a 5 SMSim
2119719000611776218MSolteiro(a)BrancaBrasileiro(a)RSEstou cursando e concluirei o Ensino Médio em 2019Não informadoPúblicaEnsino RegularNãoEstadualUrbanaEm atividadeNãoNãoNãoNãoNãoNãoNãoNãoNão402.1420.6545.6650.4EspanholSem problemas140.080.080.0100.00.0400.0Completou o Ensino Médio, mas não completou a Faculdade.Completou o Ensino Médio, mas não completou a Faculdade.3 a 4 SMSim
2119819000611777718MSolteiro(a)BrancaBrasileiro(a)RSEstou cursando e concluirei o Ensino Médio em 2019Não informadoPúblicaEnsino RegularNãoEstadualUrbanaEm atividadeNãoNãoNãoNãoNãoNãoNãoNãoNão449.1548.2538.5557.6EspanholSem problemas120.0120.0100.0100.0120.0560.0Completou o Ensino Médio, mas não completou a Faculdade.Completou a Faculdade, mas não completou a Pós-graduação.3 a 4 SMSim
2119919000611912716MSolteiro(a)BrancaBrasileiro(a)RSEstou cursando e concluirei o Ensino Médio após 2019Não informadoNão Respondeumissing valueSimmissing valuemissing valuemissing valueNãoNãoNãoNãoNãoNãoNãoNãoNão531.2425.3520.5604.2EspanholSem problemas80.0120.0120.0120.0120.0560.0Não completou a 4ª série/5º ano do Ensino Fundamental.Não completou a 4ª série/5º ano do Ensino Fundamental.1 a 1.5 SMSim
2120019000611913317MSolteiro(a)PardaBrasileiro(a)BAEstou cursando e concluirei o Ensino Médio em 2019Não informadoPúblicaEnsino RegularNãoEstadualUrbanaEm atividadeNãoNãoNãoNãoNãoNãoNãoNãoNão451.1461.0558.2586.5InglêsParte desconectada0.00.00.00.00.00.0Completou a 4ª série/5º ano, mas não completou a 8ª série/9º ano do Ensino Fundamental.Completou a Faculdade, mas não completou a Pós-graduação.2 a 2.5 SMSim
2120119000611915019MSolteiro(a)BrancaBrasileiro(a)RSJá concluí o Ensino Médio2017Não Respondeumissing valueNãomissing valuemissing valuemissing valueNãoNãoNãoNãoNãoNãoNãoNãoNão545.1547.3610.7752.9InglêsSem problemas140.0160.0160.0140.0140.0740.0Completou o Ensino Médio, mas não completou a Faculdade.Completou a Faculdade, mas não completou a Pós-graduação.4 a 5 SMSim